Jelenleg egy alapvető értelmezőt írok egy XML ízhez. Gyakorlatként egy LL tábla vezérelt elemzőt valósítok meg. Ez az én példám a BNF nyelvtanára: % token name data string %% / * LL (1) * / doc: elem elem: "<" open_tag open_tag: név attr close_tag close_tag: ">" elem_or_data "" név ">" | "/>" ; elem_or_data: "<" open_tag elem_or_data | adatok elem_vagy_adatok | / * epsilon * / ; attr: name ":" string attr | / * epsilon * / ; Helyes ez a nyelvtan? Minden terminál literál idézőjelek között van. Az absztrakt terminálokat% token adja meg. Kézzel írt lexert kódolok, hogy a bemenetemet tokenek listájává alakítsam át. Hogyan jelölném az absztrakt terminálokat?
2021-03-03 08:10:50
A klasszikus megközelítés az lenne, ha reguláris kifejezést (vagy más felismerőt) írnánk minden lehetséges terminálra. Azok, amelyeket "absztrakt" termináloknak neveztek, amelyek teljesen konkrétak, valójában azok a terminálok, amelyekhez tartozó minták egynél több lehetséges bemeneti karakterláncot ismernek fel. A ténylegesen felismert karakterláncot (vagy a karakterlánc valamilyen kiszámított függvényét) át kell adni az elemzőnek a token szemantikai értékeként. Névlegesen a beviteli karakterlánc minden pontján a tokeniser lefuttatja az összes felismerőt, és kiválasztja a leghosszabb egyezést. (Ez az úgynevezett "maximal munch" szabály.) Ez általában optimalizálható, különösen, ha az összes minta szabályos kifejezés. (F) A lex például elvégzi ezt az optimalizálást az Ön számára. Esetükben bonyolult tény, hogy nyelvének tokenizálása kontextustól függ. Különösen, ha a cél elem_vagy_adat, akkor az egyetlen lehetséges token a <, és az "data". A címke belsejében azonban az "adatok" nem lehetségesek, és a "név" és a "karakterlánc" címkék is lehetségesek (többek között). Az is lehetséges, hogy egy attribútum értéke ugyanazzal a lexikai formával rendelkezhet, mint a kulcs (azaz egy név). Magában az XML-ben az attribútumértéknek idézett karaktersorozatnak kell lennie, és egy nem idézett karaktersorozat használata hibaként jelenik meg, de minden bizonnyal vannak olyan "XML-szerű" nyelvek (például HTML), amelyekbe be lehet illeszteni az üres érték nélküli attribútumértékeket nem idézett. Mivel a lexikai elemzés a kontextustól függ, a lexikális elemzőnek át kell adnia (vagy hozzá kell férnie) egy további, a lexikális kontextust meghatározó információhoz. Ezt általában egyetlen felsorolási értékként ábrázolják, amelyet a legutóbbi visszaküldött tokenek vagy az aktuális elemző verem ELSŐ halmaza alapján lehet kiszámítani. 2 | A válaszod StackExchange.ifUsing ("editor", function () { StackExchange.using ("externalEditor", function () { StackExchange.using ("kivonatok", function () { StackExchange.snippets.init (); }); }); }, "kódrészletek"); StackExchange.ready (function () { var channelOptions = { címkék: "" .split (""), id: "1" }; initTagRenderer ("". split (""), "" .split (""), channelOptions); StackExchange.using ("externalEditor", function () { // A szerkesztőt töredékek után kell indítania, ha a kivonatok engedélyezve vannak if (StackExchange.settings.snippets.snippetsEnabled) { StackExchange.using ("kivonatok", function () { createEditor (); }); } más { createEditor (); } }); function createEditor () { StackExchange.prepareEditor ({ useStacksEditor: hamis, heartbeatType: 'válasz', autoActivateHeartbeat: hamis, convertImagesToLinks: true, noModals: igaz, showLowRepImageUploadWarning: igaz, reputációToPostImages: 10, bindNavPrevention: igaz, postfix: "", imageUploader: { brandingHtml: "Powered by \ u003ca href = \" https: //imgur.com/ \ "\ u003e \ u003csvg class = \" svg-icon \ "width = \" 50 \ "height = \" 18 \ "viewBox = \ "0 0 50 18 \" fill = \ "none \" xmlns = \ "http: //www.w3.org/2000/svg \" \ u003e \ u003cpath d = \ "M46.1709 9.17788C46.1709 8.26454 46.2665 7.94324 47.1084 7.58816C47.4091 7.46349 47.7169 7.36433 48.0099 7.26993C48.9099 6.97997 49.672 6.73443 49.672 5.93063C49.672 5.22043 48.9832 4.61182 48.1414 4.61182C47.4335 4.61182 46.7256 4.7506 4.916 43.1481 6.59048V11.9512C43.1481 13.2535 43.6264 13.8962 44.6595 13.8962C45.6924 13.8962 46.1709 13.2535 46.1709 11.9512V9.17788Z \ "/ \ u003e \ u003cpath d = \" M32.492 144.04144 144 144 144 144 144 144 0 144 0 144 0 144 144 144 144 0 144 144 144 144 144 144 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 141 214 144 144 144 144 144 144 141 141 211 együtthosás 41.5985 12.6954 41.5985 10.1419V6.59049C41.5985 5.28821 41.1394 4.66232 40.1061 4.66232C39.0732 4.66232 38.5948 5.28821 38.5948 6.59049V9.60062C38.5948 10.8521 38.2696 11.5455 37.0451 11.5455C35 521 35.4954 9.60062V6.59049C35.4954 5.28821 35.0173 4.66232 34.0034 4.66232C32.9703 4.66232 32.492 5.28821 32.492 6.59049V10.1419Z \ "/ \ u003e \ u003cpath fill-rule = \" evenodd \ "clip-rule = \" evenodd \ "clip-rule = = \ "M25.6622 17.6335C27.8049 17.6335 29.3739 16.9402 30.2537 15.6379C30.8468 14.7755 30.9615 13.5579 30.9615 11.9512V6.59049C30.9615 5.28821 30.4833 4.66231 29.4502 4.66231C28.9950 4,509 263 4 4 950 4 262 4 5 9 4 5 9 5 9 5 5 9 5 5 .1369 4.56087 21.0134 6.57349 21.0134 9.27932C21.0134 11.9852 23.003 13.913 25.3754 13.913C26.5612 13.913 27.4607 13.4902 28.1109 12.6616C28.1109 12.7229 28.1161 12.7799 28.121 12.8346C2 15.2321 24.1352 14.9821 23.5661 14.7787C23.176 14.6393 22.8472 14.5218 22.5437 14.5218C21.7977 14.5218 21.2429 15.0123 21.2429 15.6887C21.2429 16.7375 22.9072 17.6335 25.6622 17.633524 724243 724247 27.2119 7.09766 28.0918 7.94324 28.0918 9.27932C28.0918 10.6321 27.2311 11.5116 26.1024 11.5116C24.9737 11.5116 24.1317 10.6491 24.1317 9.27932Z \ "/ \ u003e \ u003cpath d = \" M16.8045.145.2535.15.253513.8962C19.3298 13.8962 19.8079 13.2535 19.8079 11.9512V8.12928C19.8079 5.82936 18.4879 4.62866 16.4027 4.62866C15.1594 4.62866 14.279 4.98375 13.3609 5.88013C12.653 5.05154 11.6581 4.612.3326.33 2653 262 262 263 13,9157 13,2535 13,9157 11,9512V8,90741C13,9157 7,58817 14,3365 6,91179 15,4269 6,91179C16,4027 6,91179 u. 13,2535 3,316 75 11.9512V6. Z \ "fill = \" # 1BB76E \ "/ \ u003e \ u003c / svg \ u003e \ u003c / a \ u003e", contentPolicyHtml: "Felhasználói hozzájárulások a (z) \ u003ca href = \" licenc alatt vannak engedélyezve / legal / content-policy \ "\ u003e (tartalmi irányelv) \ u003c / a \ u003e", allowUrls: igaz }, onDemand: igaz, discardSelector: ".discard-answer" , azonnalShowMarkdownHelp: true, enableTables: true, enableSnippets: true }); } }); Köszönjük, hogy közreműködött a Stack Overflow válaszában! Kérjük, feltétlenül válaszoljon a kérdésre. Adjon meg részleteket és ossza meg kutatását! De kerüld ... Segítség kérése, pontosítás vagy válaszadás más válaszokra. Nyilatkozatok tétele vélemény alapján; Készítsen biztonsági másolatot referenciákkal vagy személyes tapasztalatokkal. Ha többet szeretne megtudni, olvassa el a nagyszerű válaszok megírásával kapcsolatos tippjeinket. Piszkozat mentve Piszkozat eldobva Regisztráljon vagy jelentkezzen be StackExchange.ready (function () { StackExchange.helpers.onClickDraftSave ('# login-link'); }); Regisztráljon a Google segítségével Regisztráljon a Facebook segítségével Regisztráljon az E-mail és a Jelszó használatával Beküldés Hozzászólás vendégként Név Email Kötelező, de soha nem látható StackExchange.ready ( függvény () { StackExchange.openid.initPostLogin ('. New-post-login', 'https% 3a% 2f% 2fstackoverflow.com% 2fquestions% 2f54745855% 2ftokenize-abstract-terminals-in-ll-grammatic% 23new-answer', 'question_page' ); } ); Hozzászólás vendégként Név Email Kötelező, de soha nem látható Tegye közzé válaszát Dobd el A „Válasz elküldése” gombra kattintva elfogadja az Általános Szerződési Feltételeinket, az adatvédelmi irányelveket és a cookie-kat Nem a keresett válasz? Böngésszen a lexer bnf ll rekurzív-származású elemzéssel címkézett többi kérdésben, vagy tegye fel saját kérdését.